以视觉为中心的3D环境理解既是VILA的,又对自动驾驶系统充满挑战。依据,无对象的方法吸引了相当大的意义。通过预测离散体素电网的语义,但无法构建连续,准确的障碍物表面,就可以感知世界。为此,在本文中,我们提议围绕着axtingsdf,以隐式预测周围图像的连续感知的签名距离场(SDF)和语义场。具体来说,我们介绍了一种基于查询的方法,并利用了由Eikonal配方构成的SDF来准确描述障碍物的表面。此外,考虑到缺乏精确的SDF地面真相,我们提出了一个新颖的SDF监督范式,被称为三明治艾科尼尔配方,强调在表面的两边都适用于正确且密集的约束,从而增强了表面上的精度。实验表明,我们的方法可以在Nuscenes数据集上用于占用预测和3D场景重建任务的SOTA。
![arxiv:2403.14366v1 [cs.cv] 2024年3月21日PDF文件第1页](/bimg/a/a5c3f24859273dbd55566def2c5cada7382b3354.webp)
![arxiv:2403.14366v1 [cs.cv] 2024年3月21日PDF文件第2页](/bimg/2/2cd47147a2d32e6649bac124d23d27e10166e2bb.webp)
![arxiv:2403.14366v1 [cs.cv] 2024年3月21日PDF文件第3页](/bimg/5/5e9f3eff1949c5d33887ba5144d22bc431b942ad.webp)
![arxiv:2403.14366v1 [cs.cv] 2024年3月21日PDF文件第4页](/bimg/5/59650c9b4aefd10eca290b01e41535522b45f5c6.webp)
![arxiv:2403.14366v1 [cs.cv] 2024年3月21日PDF文件第5页](/bimg/3/3ae884777f561e04ceb1701d3eb27079b97aee25.webp)
